Rank in Wordlist | Frequency | Word |
---|---|---|
29582 | 15 | است,که |
41161 | 9 | امريکا,که |
41844 | 9 | شد,عجيب |
42708 | 9 | گرفت,نيازی |
44939 | 8 | ۵۰۰,۰۰۰ |
46327 | 7 | عقدده,کينه |
46716 | 7 | ميباشد,در |
46717 | 7 | ميبره,مانديم |
46896 | 7 | نواخت,تکراي |
46950 | 7 | هستيد,که |
Rank in Wordlist | Frequency | Word |
---|---|---|
8264 | 116 | خميني(ره |
10829 | 78 | علي(ع |
13792 | 57 | پاپيروس(مورسيا |
14302 | 54 | محمدباقر(ع |
16779 | 42 | فرهنگي(28 |
23088 | 23 | تار(تهمورس |
23185 | 23 | رضا(ع |
23237 | 23 | سيتار(شجاعت |
27029 | 18 | امروز)،"اشکانيان"(ايران |
27211 | 18 | جيو"(واقع |
Rank in Wordlist | Frequency | Word |
---|---|---|
2979 | 487 | اوت)، |
7019 | 148 | سپتامبر)، |
9451 | 95 | دسامبر)، |
10498 | 81 | اکتبر)، |
10744 | 79 | نوامبر)، |
13089 | 60 | ژوئن)، |
13090 | 60 | ژوئیه)، |
13214 | 59 | مه)، |
13454 | 57 | 1992)، |
13455 | 57 | 1994)/، |
Rank in Wordlist | Frequency | Word |
---|---|---|
68949 | 2 | A&K |
Rank in Wordlist | Frequency | Word |
---|---|---|
8629 | 110 | هرژه"، |
10064 | 86 | است"، |
12501 | 63 | تاريخ"، |
13507 | 57 | اوبرين"، |
13524 | 57 | برج"، |
13538 | 57 | بولاند"، |
13572 | 57 | جهان"، |
13597 | 57 | دومش"هاينريش |
13604 | 57 | راه"، |
13611 | 57 | رنگي"، |
Rank in Wordlist | Frequency | Word |
---|---|---|
36683 | 11 | مشفق'؛ |
45679 | 7 | جنتي:'رهبری |
55596 | 4 | امروز'، |
57029 | 4 | دهد' |
63568 | 3 | دودوس'، |
69020 | 2 | Goose's |
70187 | 2 | است' |
71703 | 2 | باز'، |
73979 | 2 | جدید'، |
76879 | 2 | سبز'، |
Rank in Wordlist | Frequency | Word |
---|---|---|
5500 | 212 | 1+5 |
7357 | 138 | ۱+۵ |
28640 | 16 | 5+1 |
34700 | 11 | 1+90 |
42748 | 9 | ۱+۵، |
54793 | 5 | ۵+۱ |
68417 | 3 | ۵+۱بسته |
68571 | 2 | 1+5، |
68819 | 2 | 5+90 |
86726 | 2 | ۵+۱، |
Rank in Wordlist | Frequency | Word |
---|---|---|
7122 | 145 | سنبله/شهریور |
8379 | 114 | 4/77 |
9425 | 95 | اسد/مرداد |
12627 | 62 | 5/2 |
13447 | 57 | 1677/15815 |
13455 | 57 | 1994)/، |
13456 | 57 | 3/190 |
13460 | 57 | 98/39 |
14788 | 51 | 74/91 |
14789 | 51 | 81/22 |
In the last subsection of this type we look for words containing other special characters: , ( ) % & $
" ' + * = / _
Depending on the language some of these characters may be allowed within words, other will not. If words with forbidden characters do not have very low frequency there might be a problem in preprocessing.
Words containing %:
select w_id-100,freq, word from words where w_id>100 and word like "%\%%" limit 10;
3.12.1 Words with Hyphens
3.12.2 Multiwords
3.12.3 (Multi-)Words with dots